メインコンテンツまでスキップ

実世界の検証

実世界の検証は、「数学的に正確な」モデルと「量産対応の」製品の間の橋渡しです。eFabric™ ワークフローでは、この段階で評価がシミュレーターからストレス下でTML120が機能しなければならない物理的環境へと移行します。このセクションでは、環境ノイズ、タイミング制約、物理的なハードウェア限界に対してモデルを検証することに焦点を当てます。

フィールド検証の3つの柱 エッジでの検証は、クラウドベースのAIテストと根本的に異なります。NDPはシステム電力の「ゲートキーパー」であるため、検証プロセスはモデルが極端な物理的制約下で動作しながら整合性を維持することを証明する必要があります。

1. 音響および環境ストレス

静的なデータセットを超えて、モデルが実世界の「エントロピー」をどのように処理するかをテストします。これには以下が含まれます:

  • 動的ノイズフロア: NDPのデジタル信号プロセッサ(DSP)が非定常ノイズ(例:通過する車やドアを閉める音)をフィルタリングしながら検出感度を維持する方法のテスト。

  • 空間分散: モデルの性能がデバイスの向きやトリガーイベントの距離に関係なく一定であることの確保。

  • 環境エッジケース: 「Always-On」ロジックが数学的に類似しているが文脈的には無関係な信号でトリガーされないことの検証(「混雑した部屋」効果)。

2. 決定論的タイミングとレイテンシ

産業用異常検出や音声インターフェースなどのリアルタイムアプリケーションでは、「決定」の速度は精度と同じくらい重要です。

  • シリコンネイティブ速度: NDPのハードウェア定義アーキテクチャの主要な利点である固定した予測可能な時間窓内で推論が発生することを検証します。

  • システム応答性: ホストコントローラーがイベントが終了する前に行動するのに十分な速さで警告されることを確保するために「センサー-割り込み」レイテンシを測定します。

3. リソースと電力のコンプライアンス

最終検証ステップは、モデルがTML120の**「ハードウェアバジェット」**を遵守することを確保します。

  • メモリフットプリント: モデルの重みとアーキテクチャがAt-Memoryゲート内に完全に含まれており、電力を消費する外部メモリアクセスの必要性を排除することの確認。

  • 熱的および電気的安定性: 高信頼度検出イベント中のピーク電流引き込みを監視して、システムが小型バッテリーの放電限界を超えないことを確保します。

主要な検証数式

検証レポートの定量的基盤を提供するために、以下の数学的フレームワークが適用されます:

A. 総システムレイテンシ (ttotalt_{total})

物理的イベントからシステムの反応までの遅延を定量化します。

ttotal=tsensor+tinference+thost_waket_{total} = t_{sensor} + t_{inference} + t_{host\_wake}

ここで:

  • tsensort_{sensor}: 生入力データをデジタル化してバッファリングするのにかかる時間
  • tinferencet_{inference}: NDPがニューラルネットワークのレイヤーを処理するのにかかる時間
  • thost_waket_{host\_wake}: プライマリCPUがディープスリープから起動するのに必要な時間

B. 電力バジェットコンプライアンス (PcompP_{comp})

実際の電力引き込みがターゲットバッテリーの設計限界内に収まることを確保します。

Pcomp=(PactualPlimit)×100P_{comp} = \left(\frac{P_{actual}}{P_{limit}}\right) \times 100

ここで:

  • PactualP_{actual}: 推論中のTML120の実測電力消費
  • PlimitP_{limit}: システム設計で許容される最大電力閾値
💡「ゴールデンサンプル」ルール

「検証は常に「ゴールデンサンプル」の作成で終わる必要があります—量産のベンチマークとして機能する最終モデルを実行する物理デバイスです。ゴールデンサンプルがノイズの多い環境でPcompとttotalのターゲットを満たす場合、モデルはデプロイメントの準備ができています。」


音響環境のフィールドテスト

実験室で訓練されたモデルは、実世界の設定の音響的複雑さにさらされると苦労することがよくあります。フィールドテストにより、NDPがこれらの課題にもかかわらずAlways-On性能を維持できることを確保し、クリーンなデジタルデータからターゲット環境の「予測不能な空気」に評価を移します。

A. 信号対雑音比(SNR)ストレステスト

検証では、周囲のバックグラウンドノイズが増加するにつれてモデルがターゲットイベントを正常に検出する能力を測定します。これらのテスト環境の難しさを定量化するために、SNR数式を使用します。これにより、エンジニアはモデルの再現率が重いノイズ下で失敗し始める「ブレークポイント」を見つけることができます。

数式:信号対雑音比 (SNRdBSNR_{dB})

SNRdB=10log10(PsignalPnoise)SNR_{dB} = 10 \log_{10} \left( \frac{P_{signal}}{P_{noise}} \right)

B. 残響と距離

音は部屋の物理的な形状に基づいて異なる動作をします。
ソースとTML120モジュールの間の距離が増加するにつれて、信号は自然にエネルギーを失います。
モデルが最大必要範囲(例:5m)で反応し続けることを確保するために、信号減衰計算を使用します。

数式:信号減衰 (AA)

基準距離(drefd_{ref})に対する距離(dd)での信号強度の損失を計算するために:

A=20log10(ddref)A = 20 \log_{10} \left( \frac{d}{d_{ref}} \right)

C. 「混雑した部屋」効果(干渉)

テレビの対話、エアコンのハム、または無関係な会話などの競合する音に対してデバイスをテストします。ここでは、環境が類似した周波数成分を持つ非ターゲット信号で「ノイジー」な場合でも、**偽受理率(FAR)**が低く維持されることを検証します。

💡「ネガティブ環境」キャプチャ

「フィールドテスト中、ターゲットイベントだけを記録しないでください。「何もない」を何時間も記録してください—ターゲット環境の周囲ノイズだけ(例:夜の工場の床)。これをネガティブテストセットとして使用して、部屋が空でノイジーな場合にモデルが「ファントムトリガー」を持たないことを確保します。」


レイテンシと推論速度の最適化

エッジAIの世界では、「インテリジェンス」はその応答性と同じくらい価値があります。音声起動アシスタントや産業用安全トリガーなどのアプリケーションでは、物理的イベントとシステムの反応の間の遅延—レイテンシと呼ばれる—を最小化する必要があります。このセクションでは、eFabric™ エコシステムの決定論的タイミングを検証することに焦点を当て、検出がほぼ瞬時で完全に予測可能であることを確保します。

A. パイプラインレイテンシ:シリコンの旅

パイプラインレイテンシは、データがNDPシリコンの3つの柱を通過するために必要な内部時間を測定します。NDPはシリコンネイティブでソフトウェアインタープリタに依存していないため、このレイテンシは固定されており測定可能です:

  • デジタル信号処理(DSP)レイテンシ: 生センサー入力をデジタル化してフィルタリングするために必要な時間(例:FFTやメルビニング)。

  • ニューラル推論レイテンシ: データがハードワイヤードニューラルゲートを流れるのにかかる時間。

  • 割り込み生成: 最終ニューラル決定からIRQピンの物理的な切り替えまでの時間。

B. 総システムレイテンシ (ttotalt_{total})

エンドユーザーにとって重要な唯一の数値は「センサーからアクション」の遅延です。
NDPの処理時間とホストコントローラーの起動時間を合算することで総システムレイテンシ**を検証します。

数式:総システムレイテンシ (ttotalt_{total})

ttotal=tsensor+tinference+thost_waket_{total} = t_{sensor} + t_{inference} + t_{host\_wake}

C. 決定論的タイミング:ジャック・オブ・オール・トレードのキラー

バックグラウンドOSタスクによりジッタ(タイミング変動)に悩まされる汎用MCU(Cortex-M)とは異なり、NDPのアーキテクチャは決定論的です。環境に関係なく推論時間が一定であることを検証します。これはリアルタイム安全および高速産業用異常検出にとって重要です。

💡割り込みファーストデザイン

*「thost_wakeを最小化するために、ホストプロセッサが**ファスト割り込み(FIQ)*に設定されていることを確保してください。NDPがトリガーするたびにホストが完全なOSブートシーケンスを実行する必要がある場合、eFabric™ シリコンの速度の優位性が無効になります。」


リソース利用率:RAMとフラッシュ管理

検証の最終段階は、最適化されたモデルがTML120モジュールの物理的「ハードウェアバジェット」を遵守することを確保します。NDPアーキテクチャは極端な電力効率のために設計されているため、固定されたAt-Memoryストレージシステムを使用します。リソース利用率の検証は、構築したインテリジェンスがシリコンに完璧に収まり、オーバーフローや電力を消費する外部メモリスワップを必要としないことを確認するプロセスです。

A. ウェイトメモリ(RAM)検証

TML120は推論中のゼロレイテンシアクセスを確保するために、ニューラルネットワークの重みを特殊な内部スタティックメモリに保存します。

  • 容量チェック: 量子化パラメータの総数(P)にビット幅(通常8ビットまたは4ビット)を乗算した値が内部RAM限界を超えないことを確認します。

  • 「At-Memory」の優位性: すべての重みを内部に保持することで、NDPは「フォン・ノイマンボトルネック」を回避します。外部メモリからプロセッサへのデータ移動は、計算自体よりも100倍多くのエネルギーを消費します。

B. フラッシュストレージとブート時間 NDPは内部RAMから実行しますが、モデルはデバイスの電源が切れている間、TML120のオンボードシリアルフラッシュに「保存」されています。

  • バイナリサイズ: コンパイルされたファームウェアイメージを測定して、利用可能なフラッシュセクターに収まることを確認します。

  • ブートレイテンシ: 内部コントローラーがスタートアップ時にフラッシュからNDPゲートにモデルをロードするのにかかる時間を検証します。エネルギーを節約するために頻繁に電源サイクルを行うデバイスには、高速なブートアップが不可欠です。

C. 電力バジェットコンプライアンス 高解像度電力アナライザーを使用して、システムの電気的安定性に関する最終チェックを行います。「バーストインフェランス」(NDPがトリガーを確認するために最も激しく作業している)中でも、ピーク電流が標準的なコイン電池の安全な放電限界内に収まることを確保します。

💡「スワップ」警告

*「モデルが内部RAMに対して大きすぎる場合、アクティブ推論中に外部フラッシュから重みを「ストリーミング」しようとしないでください。これにより電力消費とレイテンシの大幅なスパイクが発生します。代わりに、**(プルーニングに関するセクション)*に戻り、チップにネイティブに収まるまでモデルアーキテクチャを洗練してください。」